Meta发布Llama 4,实际体验如何? 作为一名开发者,他深入体验了Meta最新发布的Llama 4大语言模型。从MOE架构的应用到实际操作中的优缺点,再到对未来发展的展望,他的分享为我们揭示了这款开源模型的真实面貌。 知乎热点 2025年04月06日 13:37 0 点赞 0 评论 58 浏览
第一批DeepSeek开发者为何开始逃离? 本文深入探讨了DeepSeek首批开发者选择离开的原因,分析了其背后的行业现状及未来发展方向。通过罗福莉等开发者的经历,揭示了开源大模型在商业化道路上面临的困境与机遇。 36KR热点 2025年02月19日 22:42 0 点赞 0 评论 77 浏览
DeepSeek再放大招!V3/R1训练细节全面揭秘 在36KR平台上,DeepSeek最新发文,全面公开了V3/R1的训练细节。从美团开源的龙猫大模型,到OpenAI的GPT - 5,再到DeepSeek的新品,顶尖玩家都在关注'混合推理'与'自适应计算',这标志AI发展方向转变。DeepSeek - V3.1模型采用混合推理架构,经Post - Training优化后Agent能力增强,Base模型已开源且增加训练量,在价格方面也将调整API接口调用费用。 36KR热点 2025年09月01日 23:40 0 点赞 0 评论 44 浏览
DeepSeek推翻两座大山:中国AI创业公司如何以极低成本实现技术突破 文章介绍了中国AI创业公司DeepSeek如何通过创新和技术突破,在全球范围内引发广泛关注,并探讨了其对未来AI领域的影响。 头条热点 2025年01月28日 03:05 0 点赞 0 评论 90 浏览
OpenAI开源大模型来了!轻量版Deep Research免费可用 作为一名热爱技术的探索者,他深入研究了OpenAI最新发布的开源大模型及其轻量版Deep Research。从图像生成到开源模型,再到免费使用的轻量版,每一项技术都展现了OpenAI对未来AI发展的深刻理解与战略布局。 36KR热点 2025年04月26日 04:07 0 点赞 0 评论 60 浏览
第一批DeepSeek开发者为何开始逃离? 本文从一名开发者视角出发,探讨了DeepSeek崛起背后的原因及其对行业的影响,同时分析了开发者逃离的现象及原因。 百度热点 2025年02月20日 09:25 0 点赞 0 评论 88 浏览
英伟达回应DeepSeek模型:AI领域的黑马崛起 本文从个人视角出发,详细探讨了DeepSeek大模型的崛起及其对AI行业的影响,特别是对英伟达的冲击。文章分析了DeepSeek的成本优势、市场表现以及英伟达的回应,展望了未来AI领域的发展前景。 头条热点 2025年01月28日 09:46 0 点赞 0 评论 79 浏览
DeepSeek-Prover-V2-671B 新模型开源发布:AI 推理领域迎来新变革 DeepSeek 最新推出的 DeepSeek-Prover-V2-671B 开源模型正式上线 Hugging Face,采用高效 safetensors 格式,引发 AI 社区广泛关注。 IT热点 2025年05月01日 11:50 0 点赞 0 评论 54 浏览
英伟达与DeepSeek联手:满血版DeepSeek-R1模型性能突破天际 英伟达宣布创造满血DeepSeek-R1模型AI推理性能的世界纪录,本文详细解读了DeepSeek-R1的性能表现、各大厂商的支持情况以及实际应用场景,并对未来算力需求进行了展望。 IT热点 2025年03月19日 21:37 0 点赞 0 评论 56 浏览
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源 本文详细介绍了中国创新型科技公司DeepSeek最新推出的7B参数视觉多模态开源模型Janus-Pro-7B,探讨了其技术特点、应用场景以及对行业的意义。 IT热点 2025年01月28日 13:03 0 点赞 0 评论 79 浏览